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Предлагается тюнинговая программная система для автоматического исследования и решения 
систем линейных алгебраических уравнений с приближенно заданными входными данными на 
гибридных компьютерных системах, обеспечивающая адаптивную настройку алгоритма, программы и 
конфигурации гибридной системы на свойства компьютерной модели задачи, для ее эффективного 
решения, с оценкой достоверности результатов. При этом, пользователи освобождаются от проблем, 
связанных с программированием на сложных гибридных системах. 
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Введение 

Математическое моделирование и связанный с ним численный эксперимент 
являются одними из основных средств изучения различных явлений природы и 
процессов во многих предметных областях: аэродинамика, экономика, экология, 
астрофизика, медицина и т. д. Численные эксперименты позволяют получать новые 
знания о тех явлениях и процессах, исследования которых с помощью натурных 
экспериментов наталкиваются на серьезные трудности. Однако, проведение 
математического моделирования на компьютере требует значительного времени и 
предварительных исследований (постановка прикладной задачи, создание физических, 
математических и дискретных моделей, разработка алгоритмов, вычислительных схем, 
программ решения и т.д.) [1]. Заметим, что эти исследования относятся к матема- 
тическим задачам, и они осуществляются традиционными математическими 
средствами. Но в компьютере, после ввода данных, возникает компьютерная модель 
задачи, свойства которой в ряде случаев могут отличаться от свойств математической 
задачи [2, 3]. В некоторых случаях при решении практических задач компьютеры 
выдают решение, не имеющееся физического смысла. Это выясняется в ходе 
сопоставления данных численного и натурных экспериментов. Такая ситуация может 
происходить из-за ряда причин: из-за погрешностей в задании исходных данных, 
которые имеют место при решении прикладных задач; из-за погрешностей округлений 
при вычислениях; из-за отличий аксиоматики машинной математики и аксиоматики 
математики. Получение компьютерных решений с гарантией их достоверности 
является важнейшим требованием к современному программному обеспечению. 


СА.Н. Химич, А.Ю. Баранов, А.В. Попов, Т.В. Чистякова 113 


155М 1561-5359. Штучний 1нтелект, 2016, № 2 


В настоящее время наблюдается определенная тенденция в развитии 
вычислительных систем. С одной стороны, как и прежде, продолжается рост 
производительности компьютеров за счет увеличения числа процессорных ядер, а с 
другой стороны, становятся все более популярными многоядерные компьютеры (СРИ) 
с использованием графических процессоров (СРУ) — компьютеры гибридной 
архитектуры, высокая производительность которых обусловлена применением 
вычислительных ресурсов принципиально новой архитектуры. Первое направление 
развития требует от алгоритмов большой степени параллелизма на однотипных 
процессорных ядрах, которые на программном уровне реализуются с помощью 
специальных систем параллельного программирования, таких, например, как МРТ, 
ОрепМР. Второе направление требует от алгоритма более сложной многоуровневой 
параллельной модели, которая учитывает различные архитектуры используемых 
вычислительных ресурсов. Кроме того, требуются навыки параллельного 
программирования на СРО с использованием систем ОрепСГ, СОПА ит. д. 

Известно, что многие программные приложения из различных предметных 
областей зависят от успешного решения систем линейных алгебраических уравнений 
(СЛАУ) больших размеров, к которым сводятся решаемые задачи. Причем, на решение 
линейных систем тратится большая часть времени из общего времени решения задачи. 
Поэтому проблеме создания эффективного программного обеспечения для решения 
задач линейной алгебры уделяется пристальное внимание. 

Существует большое количество высокопроизводительных программных средств, 
для решения СЛАУ на компьютерах различных параллельных архитектур, например, 
известные математические библиотеки стандартных программ — п МКГ, ГАРАСК, 
МАТГАВ, Зса  АРАСК, МАСМА и другие. Однако в этих библиотеках исследо- 
вательская функция компьютерной модели задачи и анализа результатов решения 
реализована частично, а учет приближенного характера модели возлагается на 
пользователя. При их использовании, для решения линейных систем с приближенными 
данными, могут возникать проблемы достоверности компьютерного решения, во 
избежание которых в компьютере необходимо: исследовать корректность постановки 
математической задачи; определить обусловленность задачи; оценить погрешность 
решения и т. д. Другая проблема связана с эффективным использованием 
вычислительных ресурсов гибридного компьютера. 

Предлагается тюнинговая программная система для автоматического 
исследования и решения СЛАУ с приближенными данными на гибридных 
компьютерах, обеспечивающая адаптивную настройку алгоритма, программы и 
конфигурации компьютера на свойства компьютерной модели задачи для ее 
эффективного решения с оценкой достоверности результатов. 

Методология автоматического исследования и решения линейных систем с 
приближенными данными на гибридном компьютере 

Основными принципами рассматриваемой методологии являются: планирование 
вычислений с эффективным использованием вычислительных устройств; исследование 
свойств компьютерной модели задачи и автоматическое построение необходимого 
алгоритма, синтез соответствующей программы решения; анализ достоверности 
решения системы; обеспечение работы пользователей на компьютере со сложной 
архитектурой, как на однопроцессорном компьютере [4]. 

Созданы гибридные блочные алгоритмы прямых методов 1.1/7-разложения, Г.0Г/- 
разложения и [Г0-разложения для решения СЛАУ с плотными, ленточными, 
разреженными невырожденными матрицами, а также метод сингулярного разложения 
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(5УБ-разложение) для нахождения нормального обобщенного решения систем с 
матрицами неполного ранга. На основе этих алгоритмов, реализуется компьютерное 
исследование математических свойств задачи с приближенными данными, а именно: 
существование и единственность классического решения СЛАУ, обусловленность 
матрицы, вырожденность матрицы, в том числе в пределах точности вычислений на 
компьютере. В случае симметричной матрицы исследуется ее положительная 
определенность. По результатам исследования автоматически выбирается 
необходимый алгоритм и синтезируется программа решения задачи с оценками 
достоверности компьютерных результатов. 

Для эффективного использования ресурсов гибридного компьютера выполняются 
следующие действия: анализируются возможные вычислительные схемы с целью 
разделения исходной задачи на части (подзадачи), которые могут быть реализованы в 
значительной степени независимо друг от друга; устанавливается приоритетность 
выполнения подзадач, информационные зависимости между ними, объем каждой 
подзадачи; определяются необходимые или доступные для решения вычислительные 
устройства (процессоры и ядра СРО, мультипроцессоры СОРИ). Двухуровневая 
организация памяти гибридного компьютера предусматривает двухуровневую 
МРНСОРА параллельную реализацию алгоритмов и программ. На верхнем уровне 
распараллеливание осуществляется между распределенной памятью вычислительных 
узлов, используя межпроцессорные обмены с помощью МР! На нижнем уровне 
распараллеливание на СРИ происходит с помощью СОПА с использованием сложной 
иерархичной памяти графических процессоров [5]. 

При реализации подзадач на СРО очень остро стоят вопросы определения 
необходимой топологии и оптимального количества процессов, поскольку на 
взаимосвязи между процессорами тратится значительная часть времени [3]. Для 
каждого алгоритма предусмотрено автоматическое создание виртуальной топологии 
межъядерных связей СРИ (кольцо, решетка, тор, гиперкуб и т. д.) с помощью соот- 
ветствующих функций системы МРГ. Процесс — это часть программы (подзадачи), 
которая выполняется на одном ядре СРО, использует для своей работы часть локальной 
памяти, а также содержит ряд операций приема / передачи данных для организации 
информационного взаимодействия между другими процессами. Для каждого алгоритма 
автоматически выполняется распределение матриц и векторов между процессами, 
обеспечивая балансировку загруженности ядер и процессоров СРИ. Кроме того, с 
целью улучшения быстродействия вычислений, процессоры СРО активно используют 
кэш-память. 

Графический процессор устроен принципиально иначе. Большое количество 
потоков команд выполняется одновременно, обеспечивая массовый параллелизм 
вычислений и их высокое быстродействие на СРО. Однако, использовать 
вычислительные возможности СРО в полной мере можно только в том случае, когда 
задача распараллеливается на сотни исполняющих потоков, то есть, когда одна и та же 
последовательность математических операций применяется к большому объему 
данных (например, ’матрично-матрично/матрично-векторные операции). СРО 
отличается от СРИ также по принципам доступа к памяти. Технология СОРА создает 
на СРО 6 видов памяти, каждая из которых имеет свое назначение. На рис. 1 
представлена блок-схема исследования и решения СЛАУ с плотными матрицами. 
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Рис 1. Фрагмент блок-схемы автоматического исследования и решения СЛАУ 
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Автоматическая тюнинговая программная система шраг00]_5 


Автоматическая тюнинговая программная система шра\оо|_ 2 для решения СЛАУ 
с приближенными данными разработана и функционирует в Институте кибернетики 
им. В.М. Глушкова НАН Украины на суперкомпьютерах гибридной архитектуры 
Инпарком_© и СКИТ-4 [4, 6]. Архитектура шрайоо| © схематичеки представлена на 


рис. 2. 
Диалоговая система 
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Рис 2. Архитектура шрагоо]_® 


Программная реализация шрацоо|_ > выполнена с применением клиент-серверной 
архитектуры. Доступ к шрацоо| © осуществляется по паролю, имени пользователя и 
электронного сертификата как локально, так и в Пиегее. 

Программные модули в Шрацоо|_® используются для автоматического 
построения необходимого алгоритма и соответствующей топологии компьютера, а 
также для автоматического синтеза необходимой программы решения задачи на основе 
выявленных свойств компьютерной модели задачи. Связь между модулями 
устанавливается по данным и по управлению. 

Принципы автоматического исследования и решения линейных систем на 
компьютере с автоматическим анализом достоверности результатов определяют 
следующие требования к системе управления и планирования в шрагоо|_: 

1) анализ исходных данных, полученных от пользователя, и преобразование их в 
первичные знания о свойствах компьютерной модели задачи; 

2) возможность хранить, обрабатывать и применять полученные знания о свойствах 
задачи при планировании вычислений; 

3) автоматическое построение гибридных алгоритмов и синтез программ исследования 
и решения задач; 

4) установление необходимого количества СРО и СРО, построение компьютерной 
топологии для эффективного решение задачи; 
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5) распределение и сбор данных о задаче между процессорами СРО и СРЦ. 
6) выдача и сохранение результатов исследования и решения для последующего их 
использования, объяснения и визуализации. 


Система объяснений отвечает на вопросы: как было получено решение задачи, 
почему был выбран такой путь процесса исследования свойств; выдает полученное 
решение с оценками достоверности или объясняет причины отказа в его получении. 


Справочная система позволяет пользователю получить необходимую 
информацию, чтобы решить его задачу с помощью Шшрайоо! 2: о функциональных 
возможностях, порядке работы, вводе исходных данных, глоссарий используемых 
терминов из предметной области ит. д. 

С помощью диалоговых средств в шрабоо| © осуществляется взаимодействие с 
пользователем, а именно: постановка задачи и ввод исходных данных; запуск задачи на 
выполнение; взаимодействие (по желанию) в ходе вычислительного процесса; 
визуализация полученных результатов; доступ к блоку объяснений; получение 
информационно-справочных сведений и помощи на каждом этапе работы. 

Диалоговая система дает возможность пользователям осуществлять постановку 
исходной задачи, а последовательность действий для получения ее решения автома- 
тически определяется самим программным средством. Порядок взаимодействия 
шраноо|_2 и пользователя устанавливается посредством главного меню. Его структура 
и основные пункты естественны и привычны для пользователя, поскольку присущи 
многим диалоговым системам. При вводе исходных данных пользователь заполняет 
оконные формы при помощи подсказок и инструкций или отвечает на вопросы 
шраноо! 2. На рис. 3 представлено окно ввода исходных данных линейной системы в 
шрамоо]_ю. 
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при ог дай: 'ЕИе (Машх) 
'Рогт оНазк: 


Мигтоег о! го\5: 1000] 
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Рис 3. Окно ввода исходных данных в шрацоо!_е 


Решение задачи может реализовываться автоматически, когда ее исследование и 
решение выполняются без вмешательства пользователя, и интерактивно, когда на 
отдельных или на всех этапах исследования и решения задачи возможно участие 
пользователя (рис. 4). 
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\Лемипд о ргоюсо! 07 зо Мпа 
\Мемлпд оГуес{огз о! зошоп 


За\мпд о! месюгз о? зойИюп 


| васкло ше заесйоп ога аз огргошет || Епа | 


Рис 4. Окно выбора режима решения задачи в шрагоо]_® 


По окончании решения задачи в шрацоо|_с пользователь получает в протоколе 
решения сообщения о ходе решения, выявленных свойствах задачи, достоверности 
полученных результатов решения или причинах отказов в решении. 


Пример исследования и решения СЛАУ в шгаг‘о0]_2 


Рассмотрим на конкретном примере как работает шганоо! © на компьютере 
гибридной архитектуры СКПТ-4. 


Задача. Исследовать и решить в Шрацоо] © систему Ах = Ь ,‚ где элементы 
симметричной матрицы вычисляются по формулам: А = (аз), в] =10п, п=Зи +1, 


м =1,2,...; а=п-ьЬ а=пт+1-— тах( ]). 
Матрица А имеет вид: 
п-1 п-1т-2 2 1 
пр п-2т-2 2 1 
2 п-2 п-2 п-3... 2 1 
2 2 2 .. 1 1 
1 1 1 .. 1 0 


Элементы правой части вычисляются по формулам: 


Б=} БЕПЬЬ если! [ 2: Р;= п+1-1 если! > 2. 
Точное решение системы: х=(0 1 О... о). 


Ниже приведен листинг протокола автоматического исследования и решения 
СЛАУ в Шраноо! ©. 
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РКОВГЕМ: 
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ВЕЗОТТ$: ЗОГОТОМ У/А$ САГСОГАТЕР 

фе ЯгзЕ 12 сотропенз оё зо Ной (уесюг 1) аге: 

4.3032264е-10 1.0000000е+00 1.0771629-09 -3.0017623е-10 

-8.4157109е-11 -3.6427290е-11 -2.1761434е-10 7.6932562е-11 

6.5265384е-11 1.5581740е-10 -3.4085320е-11 -1.9264943е-10 
Тие уесгог($) оЁ зошНоп аге зиосеззЯШу зюгед 1п Ме Ше тез оли 

Елот еипанойз: 4.99145е-08 

Ргорег Нез: 

- езатаной оЁ соп 1 во па! глиибет: 7.49316е-07 

- тавих тай: 999 (999) 


№Мшибег оЕргосеззогз: 1 


Как видно из протокола, пользователь указал, что исходные данные системы 
заданы точно. Однако в шраНоо| © проводится исследование системы, введенной в 
компьютер, с учетом ошибок округлений при вводе. Поскольку матрица является 
симметричной, то пробным алгоритмом для исследования задачи был выбран 
гибридный алгоритм (удвоенная разрядность) Г1/-факторизации на одном СРО с 
использованием одного СРО, как наиболее экономичный по использованию 
вычислительных ресурсов и времени решения для таких матриц. Однако, в процессе 
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исследования СЛАУ, этим алгоритмом матрица оказалась не положительно- 
определенной и шрайоо! © автоматически продолжил исследование задачи гибридным 
алгоритмом ГИ-факторизации на одном СРУ с использованием одного СРО. В 
процессе исследования системы этим алгоритмом матрица оказалась машинно- 
вырожденной. Автоматически была  синтезирована программа нахождения 
обобщенного решения гибридным 5УЛ-алгоритмом с использованием одного СРО и 
одного СРО-ускорителя. Задача была решена (в протоколе мы имеем 12 первых 
компонентов решения). Вычислены оценка достоверности полученного решения, а 
также оценка спектрального числа обусловленности, ранг матрицы. Весь вектор 
решения в бинарном виде автоматически сохранен в файле гези!. оц. 

Проведем анализ прохождения процесса решения этой задачи с помощью высоко- 
производительных программ из библиотек Гараск, Зса. АРАСК, Маота. Программы 
этих библиотек ориентированы на точно заданные исходные данные. Чтобы правильно 
определить необходимую программу решения этой задачи, пользователю необходимо 
знать свойства матрицы системы (положительно определенная, невырожденная или 
вырожденная), которая введена в компьютер. Заранее это сделать зачастую невозможно 
из-за приближенного характера исходных данных и ошибок округлений при их вводе в 
компьютер. Таким образом, пользователю потребуется потратить дополнительное 
время на самостоятельное исследование задачи. Для этого ему придется осуществить 
несколько постановок задач, используя различные программы. Анализ достоверности 
полученного решения также возлагается на пользователя. 

Выводы 

Многие научно-технические задачи сводятся к решению СЛАУ больших 
размеров, для решения которых требуется эффективное использование ресурсов 
гибридных компьютеров. В условиях приближенных данных свойства компьютерных 
моделей априори не известны. Поэтому необходимы такие подходы к созданию 
программного обеспечения для гибридных компьютеров, которые бы обеспечивали 
пользователей достоверным компьютерным решением при эффективном 
использовании СРО и СРО. 

Предлагается автоматическая тюнинговая программная система шрацоо| © для 
исследования и решения СЛАУ на гибридных компьютерах с функцией адаптивной 
настройки алгоритма, программы и архитектуры гибридной системы на свойства 
решаемой задачи для ее эффективного решения с оценкой достоверности 
компьютерных результатов. Использование Шшрайоо| © позволяет пользователю: 
работать на компьютере гибридной архитектуры так же, как и на однопроцессорном 
компьютере; сократить время постановки и решения задачи примерно на два порядка; 
гарантировать достоверность полученных машинных результатов. 
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тафетайса|] ргоет. ш зоте сазез, ш з9уше ргоМетз оЁР епошеегте ап $с1лепсе 
сотрщег э21уез а 4ес151оп, уеЬ Ваз по рвузса| теаппе. ТБ1$ зйиайоп сап оссиг дие оЁ 
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Фе ргоет$ оЁ рагаПе71пс (азК$ оп а ВублаА сотршег. 
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